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摘 要 : 为 了 掌握 丘陵 地 区 农田 土壤 有 效 铁 含量 及 其 空间 分 布 ， 本 文 以 重庆 市 江津 区 永 兴 镇 内 同 源 成 士 母 质 的 典型 丘陵 (2 
km2) 为 研究 区 ,采集 309 个 土壤 样 点 ,利用 普通 克 里 格 (Ordinary Kriging，OK)、 多 元 线性 回归 (Multiple Linear Regression, 


MLR)、 随 机 森林 (Random Forest,, RE) 模 型 ， 结 合 高 程 、 披 度 、 坡 向 、 谷 深 、 平 面 曲率 、 齐 面 曲率 、 汇 聚 指数 、 相 对 坡 位 指数 、 
地 形 湿度 指数 等 地 形 因子 对 土壤 有 效 铁 进行 空间 分 布 预测 ， 并 通过 85 个 验证 点 评价 、 筛 选 预测 模型 。 结 果 表 明 : (1) 土 壤 有 
效 铁 与 谷 深 、 地 形 湿度 指数 存在 极 显著 水 平 正 相关 关系 ， 与 坡度 、 平 面 曲率 、 剖 面 曲率 、 汇 聚 指数 、 相 对 坡 位 指数 存在 极 显 
著 水 平 负 相关 关系 ; (2) 随 机 森林 模型 的 预测 精度 明显 高 于 多 元 线性 回归 和 普通 克 里 格 插值 ， 其 平均 绝对 误差 为 22.33 mg kg, 
均 方 根 误差 为 27.98 mg.kg !、 决 定 系数 为 0.76, 是 研究 区 土壤 有 效 铁 含量 空间 分 布 的 最 适 预测 模型 ; (3) 地 形 湿度 指数 和 坡度 
是 影响 该 区 域 土壤 有 效 铁 含 量 空间 分 布 的 主要 地 形 因子 。 可见 ,基于 地 形 因子 的 随机 森林 预测 模型 可 以 较 好 地 解释 丘陵 区 农 
田 土壤 有 效 铁 含 量 的 空间 变异 ,研究 结果 为 丘陵 区 土壤 中 、 微 量 元 素 含量 及 空间 分 布 预测 提供 方法 借鉴 和 理论 依据 。 
关键 词 : 地 形 因子 ;随机 森林 模型 ;土壤 有 效 铁 ; 空间 分 布 预测 
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Prediction of spatial distribution of soil available iron at a typical hilly farmland 


based on terrain attributes and random forest model 
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Abstract: Soil available iron is essential to plant growth. The detailed information about the spatial distribution of soil available iron 
will be important for effective management of soil fertility. To date, the published works mainly focused on investigating the spatial 
variability of soil available iron. Fewer of them were conducted to predict the spatial distribution of soil available iron. In order to 
understand the spatial distribution of soil available iron in hilly areas of southwest China, we conducted a study in 2014 at a typical 
hilly region which has uniform soil parent material and covers an area of 2 km? in Yongxing town, Jiangjin, Chongqing. A total of 
309 samples were collected at a depth of 20 cm of the cultivated soils. They were randomly divided into calibration (224 samples) 
and validation (85 samples) datasets. Nine terrain attributes, namely, elevation, slope, aspect, valley depth, horizontal curvature, 
profile curvature, convergence index, relation position index, and topographic wetness index, were extracted from a digital elevation 
model with a spatial resolution of 2 m. The models of Ordinary Kriging (OK), Multiple Linear Regression (MLR), and Random 
Forest (RF) were used to predict the content of soil available iron based on the terrain attributes. Accuracy indicators including mean 
absolute error (MAE), root mean square error (RMSE), and coefficient of determination (R?) were applied to evaluate model’s 
performance based on the validation dataset. The results of correlation showed that the topographic wetness index and the valley 
depth had significant positive correlations with soil available iron. The slope, the horizontal curvature, the profile curvature, the 
convergence index and the relation position index had significant negative correlations with soil available iron. Compared with OK 
and MLR methods, RF model performed best with MAE of 22.33 mg-kg-!, RMSE of 27.98 mg:kg !, and R? of 0.76. Additionally, 
the results of RF model indicated that the topographic wetness and the slope were the major factors controlling the spatial distribution 
of soil available iron. Therefore, Random Forest (RF) model combined with terrain attributes could explain the spatial variability of 
soil available iron over this area. The outcomes of the current work will provide valuable information for predicting the spatial 
distribution of the soil trace elements in hilly areas. 
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铁 是 植物 体内 细胞 色素 和 酶 的 重要 组 成 部 分 , 在 植物 光合 、 呼 吸 等 代谢 过 程 中 发 挥 着 重要 作用 , 进而 
影响 作物 的 产量 与 品质 由 3。 土壤 有 效 铁 作 为 植物 的 可 给 态 铁 ,是 土壤 对 植物 供 铁 能 力 的 重要 参考 依据 外。 
土壤 有 效 铁 的 含量 及 其 空间 分 布 受 到 成 士 母 质 、 气 候 、 地 形 、 土 壤 养分 和 土壤 耕作 方式 等 很 多 因素 的 影响 
57]， 造 成 了 区 域 土壤 有 效 铁 含量 变化 幅度 较 大 ,影响 植物 的 正常 生长 。 丘 陵 是 一 种 分 布 比较 广泛 的 地 貌 类 
型 ， 精 准 预 测 丘陵 区 土壤 有 效 铁 含量 空间 分 布 了解 土壤 有 效 铁 含量 空间 变异 特征 及 其 与 地 形 之 间 的 关系 
对 土壤 地 力 评价 和 农用 地 利用 规划 具有 极 大 的 指导 意义 。 然 而 ， 当 前 对 于 丘陵 区 土壤 属性 的 空间 分 布 预测 
研究 也 多 见 与 土壤 有 机 质 和 大 量 元 素 8-9, 针对 土壤 有 效 铁 的 相关 研究 主要 集中 于 空间 特征 分 析 。 例 如 ， 座 
琴 00 等 研究 了 农田 耕 层 区 土壤 有 效 铁 的 空间 变异 特征 及 分 布 规律 ， 杜 鹏 0 等 对 耕 层 土壤 有 效 铁 的 丰 缺 状 
况 和 空间 变异 特征 进行 了 研究 , 刘 永 红 02 等 综合 评价 了 士 壤 有 效 铁 的 空间 格局 变异 特征 。 

BS, 土壤 属性 空间 预测 的 方法 已 经 由 传统 土壤 制图 发 展 到 数字 化 土壤 制图 ， 主要 包括 : 地 统计 方法 
03]、 线 性 回归 模型 04453 和 机 器 语言 算法 06181。 地 统计 学 方法 0 在 土壤 属性 空间 预测 中 是 以 区 域 化 变量 为 基 
础 ,空间 相关 和 变异 函数 为 工具 的 数学 地 质 方法 PI。 但 是 有 时 实际 情况 不 符合 二 阶 平稳 或 内 蕴 假 设 条 件 ， 
造成 不 能 可 靠 地 应 用 地 统计 学 来 研究 士 壤 属性 空间 预测 的 问题 20; 构建 线性 回归 模型 的 前 提 条 件 是 土壤 属 
性 与 预测 变量 之 间 的 关系 是 线性 的 ， 然 而 实际 情况 中 两 者 的 关系 往往 是 非 线性 且 复 杂 的 22; 机 器 语言 算法 : 
例如 ,决策 树 (Decision Trees，DT)P31、 支 持 向 量 机 (Support Vector Machine, SVM)"4], BP 神经 网 络 (Back 
Propagation Neural Networks, BPNN)P5 等 ,近年 来 也 被 应 用 于 土壤 属性 制图 。 然 而 这 些 模型 易 出 现 过 度 拟 合 
2627 等 缺陷 。 随 机 森林 模型 也 属于 机 器 语言 算法 的 一 种 , 它 的 出 现在 一 定 程度 上 克服 了 上 述 缺 陷 , 提高 
预测 精度 ， 是 对 土壤 属性 空间 预测 方法 的 有 效 改进 和 及 时 补充 。 郭 澎 涛 23 等 利用 随机 森林 模型 结合 环境 变 
= 量 对 土壤 全 毛 进 行 空间 预测 ， 其 预测 精度 显著 高 于 逐步 线性 回归 模型 、 广 义 加 性 混合 模型 以 及 分 类 回归 树 
O ”模型 。 王 菌 茵 09 等 利用 遥感 数据 提取 辅助 环境 因子 结合 随机 森林 算法 对 丘陵 区 表层 土壤 有 机 质 进行 空间 预 
g M, 结果 显示 随机 森林 模型 在 复杂 地 貌 区 的 预测 更 有 效 。 

在 一 定 区 域 尺度 内 , 气候、 成 土 母 质 等 结构 因素 相对 一 致 ,地 形 对 水 热 条 件 起 到 重 分 配 作用 并 影响 土 
PER AP, 是 引起 土壤 属性 空间 变异 的 主要 影响 因素 B133。 因此， 近年 来 , 很 多 关于 土壤 属性 预测 的 研究 都 
会 考虑 地 形 因子 作为 重要 预测 变量 。 连 纲 G31 等 应 用 地 形 因 子 和 遥感 指数 , 分 析 土 壤 属 性 与 环境 的 关系 并 进 
行 空间 预测 ; GrimmB4 等 以 地 形 因子 和 成 士 母 质 等 环境 因子 为 辅助 变量 对 土壤 有 机 碳 进行 了 预测 ; 张 素 梅 
65 等 利用 地 形 因子 和 植被 指数 建立 了 士 壤 养分 空间 分 布 预测 模型 。 

本 研究 则 在 仅 以 地 形 因 子 为 预测 变量 , 利用 随机 森林 模型 对 丘陵 区 土壤 有 效 铁 含量 进行 空间 分 布 预 测 ， 
: 为 丘陵 区 土壤 中 、 微 量 元 素 的 空间 分 布 预测 提供 方法 借鉴 和 理论 依据 。 
< 1 材料 与 方法 

11 研究 区 概况 
本 文 以 重庆 市 江津 区 永 兴 镇 内 一 个 典型 丘陵 地 带 为 研究 区 ， 经 纬度 区 间 为 106°09’27"~106°10'9"E, 
29°00'10"~29°00'9"N, 面积 约 为 2 km2。 研 究 区 属于 亚热带 季风 气候 区 ， 年 平均 气温 18 °C, 年 日 照 时 数 1253 
小 时 , 年 降水 量 900 mm, 无 霜 期 335 d。 研究 区 为 丘陵 地 貌 , 海拔 238~328 m。 研 究 区 成 士 母 质 为 侏 罗 系 沙 
溪 庙 组 紫色 砂 页 岩 , 土地 利用 类 型 70% 以 上 为 耕地 , 主要 是 旱地 和 水 田 。 按 照 土壤 发 生 分 类 , 旱地 的 土壤 类 
型 是 紫色 土 类 、 中 性 紫色 土 亚 类 、 灰 棕 紫 泥土 属 ; 水 田 土壤 类 型 是 水 稻 士 类 、 潜 育 水 稻 土 亚 类 、 潜 育 紫 泥 
田 土 属 。 
1.2 土壤 样品 采集 与 化 学 分 析 

结合 地 形 图 和 1:1000 土地 利用 现状 图 , 依据 均匀 性 、 代 表 性 原则 ,按照 全 国 耕 地 地 力 调 查 与 质量 评 
价 技术 规程 在 研究 区 农田 进行 布点 ,在 不 同 地 形 部 位 和 坡 向 均 要 布设 采样 点 ,土壤 样 点 共 309 个 (旱地 258 
个 , 水 田 51 个 ), 样 点 分 布 如 图 1 所 示 。2014 年 11 月 进行 土 样 采集 ， 并 记录 土壤 采样 点 坐标 等 信息 ,每 个 
样 点 在 同一 样 地 中 按照 “S” 形 线路 采样 ， 取 10 钻 (0~20 cm) 耕 作 层 土 样 用 四 分 法 混 匀 成 约 1 kg 样品 。 将 样品 
带 回 实验 室 风干 、 研 磨 、 过 得 , 采用 DTPA 溶液 浸 提 一 一 原子 吸收 光谱 法 测定 样品 有 效 铁 的 含量 B91。 
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1 研究 区 DEM、 土 地 利用 及 样 点 分 布 图 
Fig. 1 Maps of DEM, land use and samples sites of the study area 

1.3 ”地 形 因 子 的 提取 

根据 研究 区 尺度 、 地 貌 等 信息 ,实地 测量 获得 研究 区 6373 个 高 程 点 和 等 高 距 为 1 m 的 地 形 图 。 在 
ArcGIS 中 , 使 用 3D Analyst 模块 ， 以 高 程 点 、 等 高 线 为 输入 变量 创建 TIN 表面 , 依据 TIN 表面 生成 2m 分 
辩 率 的 数字 高 程 模型 (Digital Elevation Model, DEM). 借鉴 地 形 与 土壤 养分 的 相关 研究 81， 本 文选 择 9 个 地 
形 因 子 : 高 程 (Elevation，Ele)、 坡 度 (Slope，Slo)、 坡 向 (Aspect， Asp)、 谷 深 (Valley depth, Vd), F m H% 
(Horizontal curvature, Hc)、 齐 面 曲率 (Profile curvature, Pc)、 汇 聚 指数 (Convergence index, CD 、 相 对 坡 位 指数 
(Relation position index, Rpi)、 地 形 湿度 指数 (Topographic wetness index, Twi)。 各 地 形 因 子 含义 见 B8， 运 用 
SimDTA 软件 B91 提取 地 形 因 子 。 参 考 DEM 空间 分 辨 率 与 地 形 信息 之 间 关 系 上 -40 的 相关 研究 ， 对 原始 DEM 
进行 重 采 样 ， 对 比 不 同 DEM 分 辨 率 (2 m 5m 10m, 15m, 30 m) 提 取 的 地 形 因 子 对 预测 结果 的 影响 ， 当 
DEM 空间 分 辨 率 为 2 m 时 ,模型 的 预测 精度 最 高 ,所 以 本 文选 择 2 m 空间 分 辨 率 的 DEM. 
1.4 预测 模型 
1.4.1 普通 克 里 格 
普通 克 里 格 (Ordinary Kriging，OR) 是 地 统计 学 的 主要 内 容 之 一 ， 以 变异 函数 理论 及 结构 分 析 为 基础 ， 
根据 已 知 采 样 点 数据 的 线性 组 合 , 在 一 定 区 域内 进行 区 域 化 变量 取 值 的 无 偏 最 优 估 计 叫 ]。 

Z (x0)=P 1 Ai Zx) 

式 中 : Z "(xo) 表 示 待 估 点 xo 的 值 , Z(xi) 表 示 第 i 个 有 效 观测 值 G = 12,3...), 天 是 通过 半 变 异 函 数 生成 的 权重 
日 1;=1。 
1.4.2 多 元 线性 回归 

多 元 线性 回归 (Multiple Linear Regression，MLR) 是 基于 普通 最 小 二 乘法 ， 以 多 个 解释 变量 的 给 定数 据 
值 为 条 件 ， 研 究 一 个 因 变 量 与 多 个 自 变 量 之 间 的 线性 关系 中 ]， 普 遍 应 用 于 土壤 养分 空间 分 布 预测 ， 其 表达 
式 为 : 


Yi = bot+Pixiit Baxzi + Pax3i...+ Pnxni 


R: x; (i = 1,2,3,...,n) 表 示 自 变量 , yj(i= 0,12,...m 和 2; G = 0,1,2,...n) 分 别 表示 因 变 量 和 自 变 量 的 回归 系数 。 

1.4.3 ”随机 森林 模型 
随机 森林 (Random Forest, RE) 是 一 种 基于 分 类 树 的 多 功能 机 器 语言 学 习 算 法 , 运用 bootstrap 重 抽样 法 

从 原始 样本 中 随机 抽取 多 个 样本 进行 决策 树 模型 的 构建 ,通过 对 多 棵 决策 树 的 预测 进行 投票 得 到 最 终结 果 。 

随机 森林 回归 时 对 数据 分 布 、 数 据 类 型 、 数 据 结构 没有 要 求 ， 并 对 噪声 和 异常 值 有 良好 的 容忍 度 , 并且 不 

容易 有 过 度 拟 合 的 状况 的 。 

15 半 方 差 函 数 

半 方 差 函 数 是 研究 土壤 属性 变异 性 的 函数 ， 可 以 确定 土壤 属性 的 空间 相关 性 5， 其 表达 式 为 


N(h) 


r(h) = saa 2 [z(x; + h) — z(x:)]? 


式 中 : xr(h) 表 示 间 距 为 h 的 点 对 之 间 的 平均 半 方 差 , Wi 表示 距离 为 疡 时 的 点 对 数量 , x RR A x A 
值 。 
1.6 ”预测 模型 构建 及 精度 评价 

本 研究 随机 选择 224 个 采样 点 (旱地 190 个 , KE 34 个 ) 作 为 训练 集 用 于 预测 模型 的 构建 , 余下 85 个 
样 点 (旱地 68 个 , 水 田 17 个 ) 作 为 验证 集 用 来 评价 模型 的 预测 精度 。 普 通 克 里 格 方法 根据 已 知 点 数据 估计 
待 测 点 ,不 需要 加 入 预测 变量 。 根 据 半 方 差分 析 得 到 的 指数 模型 , 在 ArcGIS 软件 中 进行 插值 。 多 元 线性 
归 通 过 SPSS 软件 计算 随机 森林 模型 使 用 R 软件 中 RandomForest 包 [%91 进 行 模拟 ,随机 森林 中 参数 ntree( 决 
策 树 的 数量 ) 和 mtry( 每 次 树 重 建 时 节点 分 裂 的 次 数 ) 最 终 设 定 为 分 别 为 150、3。 

模型 预测 精度 的 评价 指标 包括 : 平均 绝对 误差 (mean absolute error, MAE)、 均 方 根 误差 (root mean square 
error, RMSE) 和 决定 系数 (coefficient of determination, R> MAE. RMSE 越 小 , R 越 大 ,表明 模型 预测 精度 
越 高 。 相 关 计 算 公 式 如 下 : 


El 


MAE =~? “IM; — Pil (1) 
RMSE = 一 n -1(Mi — P;)? (2) 
fia (P; — M)? / Xi- M; — M)? (3) 
式 中 : M 为 实测 值 , P 为 预测 值 ，M 为 实测 值 均值 ,n 则 为 验证 集 样本 数量 。 


2 结果 与 分 析 
21 土壤 有 效 铁 描述 性 统计 

研究 区 土壤 有 效 铁 含量 统计 结果 如 表 1 所 呈现 。 训 练 集 土壤 有 效 铁 的 含量 范围 (3.00~276.97 mg:kg 1!) 
稍 大 于 验证 集 有 效 铁 的 含量 范围 (4.20~208.38 mg.kg-0, 训练 集 土壤 有 效 铁 含量 的 标准 差 (57.35 mg kg) 
高 于 验证 集 有 效 铁 含量 的 标准 差 (53.85 mg.kg-0。 方 差分 析 结 果 表 明 训 练 集 与 验证 集 土壤 有 效 铁 含量 差异 
不 显著 ,表明 训练 数据 和 验证 数据 对 研究 区 土壤 有 效 铁 含量 都 具有 较 好 的 代表 性 。 训 练 集 和 验证 集 的 土壤 
有 效 铁 变 异 系数 均 大 于 1, 说 明 各 采样 点 之 间 土 壤 有 效 铁 含 量 存在 明显 差异 ， 属 于 强 变异 性 ， 与 徐 小 逊 等 四] 
采用 地 统计 学 方法 研究 沱江 中 游 耕 层 土 壤 有 效 铁 的 空间 分 布 时 结果 类 似 。 训 练 集 和 验证 集 土壤 有 效 铁 含量 
的 偏 度 都 大 于 1, K-S 检验 结果 p 值 小 于 0.05, 表明 研究 区 土壤 有 效 铁 含 量 不 服从 正 态 分 布 ,对 数 转 换 后 的 
土壤 有 效 铁 服 从 正 态 分 布 , 可 用 于 多 重 线性 回归 模拟 和 普通 克 里 格 插值 。 

表 1 研究 区 采样 点 土壤 有 效 铁 含 量 描述 性 统计 


Table 1 Descriptive statistics of soil available iron 


样本 组 样本 数 最 小 值 最 大 值 中 值 平均 值 标准 差 变异 系数 偏 度 
Sample Number of Minimum Maximum Median Mean Std.Deviation Coefficient of Skewness 


group samples (mg.kg (mg: kg!) (mg: kg!) (mg.kg- (mg. kg variation 


训练 集 


Calibration 224 3.00 276.97 27.36 49.94 57.35 1.15 1.80 
samples 
验证 集 

Validation 85 4.20 208.38 26.44 49.55 53.85 1.09 1.49 
Samples 


2.2 土壤 有 效 铁 的 半 方 差分 析 

本 研究 中 根据 土壤 有 效 铁 含量 的 统计 结果 , 应 用 GS+ 软 件 进行 半 方 差 计 算 , 得 到 半 方 差 最 优 拟 合 模 型 
及 特征 参数 见 表 2。 表 中 块 基 比 即 基底 效应 ,表示 数据 的 空间 相关 性 强 弱 。 该 值 小 于 25% 为 较 强 的 空间 相 
关 性 , 大 于 75% 为 较 弱 的 空间 相关 性 , 介 于 25%-75% 表 示 中 等 空间 自 相 关 , 土 壤 有 效 铁 的 基底 效应 为 14.5%， 
说 明 具 有 较 强 的 空间 相关 性 , 表明 采样 点 之 间 土 壤 有 效 铁 含 量 的 差异 主要 受到 结构 性 因素 的 影响 ,如 气候 、 
成 士 母 质 、 地 形 等 。 因 为 该 研究 区 属 小 尺度 丘陵 区 域 , 成 士 母 质 相 同 、 气 候 条 件 一 致 , 所 以 表明 地 形 是 影 


响 土壤 有 效 铁 空 间 分 布 的 主要 因素 。 


wa 


R2 土壤 有 效 铁 的 半 方 差 模 型 参数 


Table2 Semivariance parameters of soil available iron 


拟 合 模型 块 金 值 基 台 值 块 基 比 变 程 决定 系数 
Model Nugget Sill Proportion Range R? 
(Co) (Co+C) [Co /(Co+C)] % m) 
土壤 有 效 铁 指数 模型 
560 3858 14.5 561 0.898 
Soil available iron Exponential 


2.3 土壤 有 效 铁 含量 与 地 形 因 子 的 相关 性 

表 3 为 土壤 有 效 铁 与 地 形 因 子 之 间 的 相关 性 。 土 壤 有 效 铁 与 坡度 、 谷 深 、 平 面 曲率 、 齐 面 曲率 、 汇 聚 
指数 、 相 对 坡 位 指数 、 地 形 湿度 指数 均 达 到 极 显著 水 平 相关 关系 ,表明 在 研究 区 土壤 有 效 铁 受 到 地 形 因素 
的 影响 明显 。 土壤 有 效 铁 与 谷 深 、 地 形 湿度 指数 存在 极 显著 水 平 正 相关 关系 ， 相 关系 数 分 别 是 0.298、0.592， 
表明 在 地 势 低 、 土壤 含水 量 大 的 区 域 有 利于 土壤 有 效 铁 的 积累 ; 土壤 有 效 铁 与 坡度 、 平面 曲 率 、 剖面 曲率 、 
汇聚 指数 、 相 对 坡 位 指数 存在 极 显著 水 平 负 相关 关系 ,相关 系数 分 别 是 -0.371、-0.327、-0.228、-0.174、 
-0.428, 表明 在 地 势 高 、 起 伏 大 的 区 域 , 土壤 有 效 铁 的 含量 较 低 。 

表 3 土壤 有 效 铁 与 地 形 因子 的 相关 性 


Table 3 Correlations between soil available iron and terrain attributes 


SS 


Ele Slo Asp Vd He Pc Ci Rpi Twi 


土壤 有 效 铁 
-0.174** 


—0.116 —0.371** 0.086 0.298™ -0.327" -0.228"" —0.428™ 0.592™ 


Soil available iron 


TE: 表 中 的 数据 为 训练 集 统计 分 析 结 果 。Ele 为 高 程 ; Slo 为 坡度 ; Asp 为 坡 向 ; Vd 为 谷 深 ; He 为 平面 曲率 ; Pe 为 剖面 曲率 ; Ci 为 汇聚 指数 ; Rpi 为 相对 坡 


位 指数 ; Twi 为 地 形 湿度 指数 。* 和 兰 表 明 地 形 因 子 与 土壤 有 效 铁 的 相关 性 达到 了 显著 (P<0.05) 和 极 显著 (P<0.01) 水 平 。 


Note: the results were calculated based on the data of training of set. Where Ele is the elevation, Slo is the slope, Asp is the aspect, Vd is the valley depth, Hc is 
the horizontal curvature, Pc is the profile curvature, Ci is the convergence index, Rpi is the relation position index, Twi is the Topographic wetness index. * and 


** stand for that the relationship between terrain attributes and soil available iron reached the significant level (P<0.05) and highly significant level (P<0.01), 


respectively. 


2.4 土壤 有 效 铁 含量 在 不 同 土地 利用 类 型 的 对 比 

K 4 为 土壤 有 效 铁 在 研究 区 不 同 土地 利用 类 型 的 对 比 。 由 表 可 知 ， 旱 地 样本 数 (190 个 ) 远 远大 于 水 田 
(34 个 ), 这 是 因为 旱地 与 水 田 相 比 地 形 较 复杂 , 地 块 小 且 破 碎 ， 旱 地 土壤 有 效 铁 含量 的 变化 可 能 更 易 受 地 
的 影响 ,经 方差 分 析 ， 土壤 有 效 铁 在 水 田中 含量 (151.04+11.54 mg.kg-0 明 显 大 于 旱地 (31.85+2.20 mg.kg-1)， 
且 差 异 达到 了 显著 性 水 平 。 同 时 旱地 土壤 有 效 铁 的 变异 系数 (0.95) 大 于 水 田 (0.45), 但 都 属于 中 等 变异 性 ( 变 


异 系数 在 0.1~1 之 间 为 中 等 变异 ), 说 明 在 同一 土地 类 型 中 各 采样 点 之 间 土 壤 有 效 铁 含量 存在 一 定 差异 。 


表 4 土壤 有 效 铁 在 旱地 和 水 田 之 间 的 比较 


Table 4 Comparison of soil available iron between cropland and paddy field 


最 小 值 最 大 值 中 值 平均 值 标准 差 变异 系数 
Minimum Maximum Median Mean Std.Deviation Coefficient of 
Img kg!) /(mg:kg"!) /(mg:kg"!) /(mg:kg"!) /(mg-kg"') variation 

3.00 156.60 21.24 31.85 30.37 0.95 
3.85 276.97 155.22 151.04 67.27 0.45 


土地 利用 类 型 样本 数 
Land use Number of 
type Samples 
旱地 190 
Dry land 
水 田 34 
Paddy field 
注 : 表 中 的 数据 为 训练 集 统计 分 析 结 果 。 


Note: the results were calculated based on the data of training set. 


2.4 土壤 有 效 铁 含量 模型 预测 精度 比较 


研究 区 土壤 有 效 


2 
= 


量 模型 预测 精度 通过 85 个 采样 点 (旱地 68 个 , 水 田 17 个 ) 进 行 验证 , 结果 见 表 5。 
随机 森林 (RF) 模 型 的 平均 绝对 误差 MAE(22.33 mg.kg-0、 均 方 根 误 差 RMSE(27.98 mg:kg 1) 都 明显 低 于 普通 


克 里 格 (OK)、 多 元 线性 下 
是 因为 多 元 线性 回归 (MLR) 模 型 只 能 拟 合 土壤 有 效 铁 与 地 形 因 


归 (MLR), 决定 系数 R20.76) 明 显 高 于 普通 克 里 格 (OK)、 多 元 线性 回归 


(MLR)。 这 


子 之 间 的 基本 线性 关系 ,而 对 非 线 性 关系 难 


以 预测 , 制约 了 模型 预测 精度 的 提高 ;普通 克 里 格 (OK) 模 型 预测 精度 较 低 , 原因 在 于 插值 方法 仅 利 用 了 土 
壤 有 效 铁 的 空间 自 相关 性 , 不 能 顾全 研究 区 地 形 等 环境 的 影响 。 随 机 森林 (RF) 模 型 充分 考虑 了 地 形 对 土壤 


型 


pauu 


有 效 铁 的 影响 ， 并 且 捕 捉 到 了 它们 之 间 除 线性 之 外 的 复杂 关系 ,预测 精度 较 高 。 研 究 区 土壤 有 效 铁 含量 模 
4 预测 精度 结果 进一步 表明 了 随机 森林 (RP) 模 型 自身 的 优越 性 和 利用 地 形 因子 预测 小 区 域 尺度 丘陵 农田 士 
壤 有 效 铁 含量 空间 分 布 的 可 行 性 。 
由 土壤 有 效 铁 在 旱地 和 水 田 的 比较 可 知 ,不 同 土地 利用 类 型 (旱地 、 水 田 ) 的 土壤 有 效 铁 含量 差异 显著 ， 
所 以 构建 预测 模型 时 需要 考虑 土地 利用 类 型 的 影响 。 因 为 土地 利用 类 型 属于 人 


于 定性 变量 , 随机 森林 模型 相 比 


多 元 线性 回归 模型 对 定性 变量 具有 更 好 的 包容 性 , 可 以 较 多 地 捕捉 土地 利用 类 型 与 土壤 有 效 铁 之 间 的 有 效 


信息 。 同 时 通过 表 5 的 土壤 有 效 铁 含量 预测 模型 精度 比较 可 知 ， 随 机 森林 模型 相 比 多 元 线性 回归 模型 展现 


出 较 好 的 预测 


bb 
Ke o 


地 、 水 田 ) 重 新 构建 模型 ， 


村 是 挑选 出 具有 较 好 预测 精度 的 随机 森林 模型 ,在 其 预测 变量 中 加 入 土地 在 


| 用 类 型 ( 早 


检验 土地 利用 类 型 是 否 可 以 进一步 提高 随机 森林 模型 的 预测 精度 。 基 于 地 形 和 土 


决定 系数 (R2) 为 0.66。 
下 降 。 这 是 因为 水 田 、 


地 利用 的 随机 森林 预测 模型 的 平均 绝对 


pag 


nl 


| 
结果 显示 随 着 预测 变量 中 土地 利用 类 型 ( 旱 4 


误差 (MAE) 为 23.77 mg.kg-!、 均 方 根 误差 RMSE) 为 32.95 mg-kg-!. 
也、 水 田 ) 的 加 入 ,随机 森林 模型 预测 精度 


地 的 分 布 与 地 形 密切 相关 I。 土地 利用 类 型 是 地 形 的 一 种 综合 、 整 体 、 定 性 表 
现形 式 , 水 田 、 旱 地 对 其 他 地 形 因子 造成 了 干扰 、 和 遮盖 及 共 线 性 影响 ,使 得 各 个 地 形 因子 对 模型 的 贡献 无 


法 全 部 体现 ， 导致 模型 预测 误差 增 大 ， 从 而 降低 了 模型 的 预测 精度 。 综合 模型 精度 评价 指标 , 该 研究 区 土壤 


预测 模型 
Prediction 
model 
OK 
MLR 


RF 


有 效 铁 含量 的 最 适 模型 是 基于 地 形 因 子 的 随机 森林 模型 。 


表 5 土壤 有 效 铁 含量 模型 预测 精度 


Table 5 Prediction accuracy of fitted models of soil available iron 


验证 集 Validation dataset 


MAE RMSE 
(mg: kg") (mg-kg™') 
32.97 52.38 
23.58 35.25 
22.33 27.98 


2.5 地 形 因子 对 土壤 有 效 铁 含量 空间 变异 的 影响 


图 2 展示 了 研究 区 地 形 因 子 对 随机 森林 土壤 有 效 铁 含量 预测 模型 的 影响 。 地形 作为 五 大 成 


上 因素 之 一 ， 
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壤 有 效 铁 含量 空间 分 布 的 主要 地 形 因 子 是 地 形 湿 度 指数 (Twi) 和 坡度 (Slo)。 坡度 通过 影响 区 域 降 雨 及 入 渗 时 
间 、 表 层 土壤 颗粒 运动 、 径 流 挟 沙 能 力 和 侵蚀 方式 等 来 间接 影响 土壤 肥力 特征 6353。 地 形 湿 度 指 数 可 定量 
模拟 土壤 水 分 含量 状况 和 径流 产生 潜在 能 力 , 其 值 愈 大 , 代表 土壤 含水 量 愈 大 566581。 由 土壤 有 效 铁 含量 与 


< 


进 了 土壤 有 效 铁 的 增加 59-601。 


9%lncMSE 


2 随机 森林 自 变 量 影响 力 评价 


Fig.2 Influence evaluation of independent variables by Random Forest 


指数 ; Twi 为 地 形 湿度 指数 。In the graph, IncMSE is increase in mean squared error; Ele is the elevation; Slo is the slope; Asp is the aspect; 


也 形 因 子 的 相关 性 分 析 可 知 ， 土壤 有 效 铁 含量 与 地 形 湿度 指数 (Twi) 呈 极 显 著 正 相关 (0.592); 与 坡度 (Slo) 呈 
极 显 著 负 相关 (-0.371)。 表 明 随 着 坡度 的 增加 ,地 表 陡 峭 程度 增加 ， 降 雨 对 土壤 的 侵蚀 程度 加 重 ,， 通过 淋浴 
作用 造成 土壤 养分 (土壤 有 效 铁 、 全 量 铁 、 有 机 质 等 ) 的 流失 严重 。 土 壤 全 量 铁 含量 过 低 会 直接 导致 有 效 铁 
含量 的 不 足 ,同时 土壤 中 有 机 质 的 缺乏 也 会 引起 土壤 有 效 铁 的 缺失 。 随 着 地 形 湿度 指数 的 增加 , 土壤 含水 
量 增加 ， 导 致 土壤 空气 相对 不 足 。 在 这 种 通气 不 良 的 条 件 下 ,土壤 的 还 原 性 增强 , Fe** 易 于 转换 成 Fe*, fie 


图 中 IncMSE 为 均 方 误差 增加 量 ; Ele 为 高 程 ; Slo 为 坡度 ; Asp 为 坡 向 ; Vd 为 谷 深 ; He 为 平面 曲率 ; Pe 为 剖面 曲率 ; Ci 为 汇聚 指数 ; Rpi 为 相对 坡 位 


Vd is the valley 


depth; Hc is the horizontal curvature; Pc is the profile curvature; Ci is the Convergence index; Rpi is the relation position index; Twi is the Topographic wetness 


index. 


2.6 土壤 有 效 铁 空间 分 布 预测 


应 用 以 地 形 因子 为 自 变量 的 随机 森林 预测 模型 , 在 ArcGIS 中 得 到 土壤 有 效 铁 含 量 空 间 分 布 图 (图 3)。 


由 图 可 知 ,土壤 有 效 铁 含量 分 布 趋势 与 研究 区 地 形 密切 相关 。 地势 陡 峭 的 区 域 , 土壤 有 效 铁 含量 较 低 ， 这 是 
由 于 降雨 引起 的 土壤 侵蚀 、 淋 溶 加 重 ， 造成 土壤 有 效 铁 和 其 他 土壤 养分 的 流失 ,进而 引起 土壤 有 效 铁 含量 
的 降低 。 地 形 低 洼 的 区 域 , 土壤 有 效 铁 含量 较 高 , 这 是 因为 流失 的 土壤 养分 会 在 低洼 处 聚集 ， 进一步 积累 。 


同时 地 形 低 洼 处 ,土壤 含水 量 大 , 造成 了 土壤 的 还 原 条 件 ， 更 有 利于 土壤 有 效 铁 含量 的 增加 。 
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图 3 土壤 有 效 铁 含量 空间 分 布 图 
Fig.3 Prediction map of soil available iron 
3 结论 

本 文 首先 以 地 形 因子 为 预测 变量 ， 通 过 普通 克 里 格 、 多 元 线性 回归 、 随 机 森林 等 模型 对 研究 区 土壤 有 
效 铁 的 空间 分 布 进行 预测 ， 筛 选 出 结果 较 好 的 随机 森林 模型 。 然 后 通过 对 比 基 于 地 形 -土地 利用 的 随机 森林 
模型 ， 最 终 得 出 该 研究 区 土壤 有 效 铁 含量 的 最 适 预 测 模型 是 基于 地 形 因子 的 随机 森林 模型 。 

(研究 区 地 形 与 土壤 有 效 铁 含量 空间 分 布 密切 相关 ,土壤 有 效 铁 与 坡度 、 谷 深 、 平 面 曲率 、 剂 面 曲率 、 
汇聚 指数 、 相 对 坡 位 指数 、 地 形 湿度 指数 均 达 到 极 显著 水 平 相关 关系 。 土 壤 有 效 铁 含量 空间 变异 主要 受到 
结构 性 因素 的 影响 。 

(2) 利 用 以 地 形 因 子 为 自 变量 的 随机 森林 模型 ， 其 平均 绝对 误差 MAE 为 22.33 mg'kg-!、 均 方 根 误差 
RMSE 为 27.98 mg-kg-!、 决 定 系 数 R? 为 0.76, 显著 优 于 其 他 预测 模型 ,可 以 作为 一 种 新 的 模型 利用 地 形 因 
子 对 土壤 中 、 微 量 元 素 含量 进行 空间 分 布 预测 。 

(3) 地 形 湿度 指数 和 坡度 是 影响 该 区 域 土壤 有 效 铁 含量 空间 分 布 的 主要 地 形 因子 。 

随机 森林 模型 能 较 好 捕捉 该 研究 区 地 形 因子 和 土壤 有 效 铁 含量 之 间 的 关系 ,可 以 利用 地 形 因子 解释 土 
二 有效 铁 含量 空间 变异 的 76%, 但 是 预测 精度 有 待 进一步 提高 。 在 未 来 的 研究 中 , 应 该 考虑 加 入 其 它 环境 
量 并 筛选 预测 变量 进行 随机 森林 模型 的 建 模 ， 提 高 其 在 土壤 中 、 微 量 元 素 空间 分 布 的 预测 精度 。 
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